第 27 卷 第 6 期 E 程 X 学 学 报 Vol. 27 No. 6 
201042129 CHINESE JOURNAL OF ENGINEERING MATHEMATICS Dec. 2010 
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噪声 为 厚 尾 过 程 的 非 参 数 函 数 变 点 的 小 波 估计 * 


anew, Hel? 齐 培 艳 !， 赵 文 艺 1 
(1- 西北 工业 大 学 应 用 数学 系 ， 西 安 710072; 2- 西北 工业 大 学 计算 机 科学 技术 系 ， 西 安 710072) 
搞 要 : 本 文 给 出 了 随机 设计 下 非 参数 回归 模型 中 噪声 为 无 穷 方差 过 程 的 小 波 检测 和 估计 方法 。 利 用 基于 
经 验 小 波 系数 的 检验 统计 量 ， 在 原 假设 成 立 的 条 件 下 ， 推 导出 任意 尺度 上 检验 的 临界 值 ， 证 明了 
检验 的 一 致 性 ， 在 备 择 假 设 成 立 的 条 件 下 ， 得 到 变 点 个 数 、 变 点 位 置 的 相合 估计 与 收敛 速度 。 数 
值 模拟 以 及 IBM 股票 数据 实例 分 析 的 结果 均 表 明 方法 是 有 效 的 。 
关键 词 : 随机 设计 ;， 非 参数 回归 模型 ， 无 穷 方 差 过 程 ， 变 点 ; 小 波 估计 
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1 引言 


变 点 分 析 不 仅 是 统计 学 和 时 间 序 列 分 析 研 究 的 热点 理论 问题 之 一 ， 而 且 其 理论 研究 成 果 在 
诸多 领域 都 有 应 用 ， 如 : 经 济 、 金 融 、 医 学 和 气象 学 等 领域 。 近 年 来 关于 变 点 成 果 的 综述 可 见 
文献 [1,2]。 

非 参数 回归 模型 能 够 很 好 地 描述 工程 系统 中 的 非 线 性 关系 ， 有 具有 广泛 的 研究 背景 8-9。 小 波 
变换 能 够 自动 改变 窗 长 ， 因 此 可 以 很 好 地 反映 函数 的 整体 和 局 部 特征 。 这 一 特性 使 得 小 波 成 为 
处 理 非 参数 变 点 问题 的 有 力 工具 。Wangla 基于 小 波 系数 绝对 值 的 检验 统计 量 对 变 点 进行 了 检 
测 和 估计 ; Odgent 利用 小 波 系 数 的 平方 累积 和 对 均值 变 点 进行 了 检测 ，Raimondof56] 由 小 波 
给 出 了 非 参数 回归 函数 的 minimax 估计 ， 并 解决 了 方差 有 穷 厚 尾 信 号 的 变 点 检验 问题 。 

文献 [3-6] 考虑 的 都 是 噪声 为 方差 有 穷 序 列 的 固定 设计 情形 ， 而 近年 来 引起 金融 与 经 济 研究 
领域 中 学 者 的 重视 的 是 ， 厚 尾随 机 序列 能 够 描述 许多 金融 资产 收益 率 分 布 中 正 态 分 布 无 法 描述 
的 尖峰 、 厚 尾 等 特性 中 等 。 基 于 此 ， 本 文 利用 小 波 方 法 研究 随机 设计 下 噪声 为 无 穷 方差 厚 尾 
过 程 的 非 参 数 模 型 中 ， 回 归 函 数 变 点 的 小 波 检 测 和 估计 问题 。 第 2 节 给 出 本 文 的 模型 与 假设 ， 
第 3 节 与 第 4 节 是 主要 研究 成 果 ， 最 后 是 数值 模拟 与 实例 分 析 。 


2 模型 与 假设 
R(X, Yi) o, (Xn, Yn) 是 从 如 下 随机 设计 回归 模型 获得 的 观察 值 序列 
Y=fX)+e, i=1,2,..,n. (1) 


其 中 {ei = 1,2,… n} 为 中 心 化 的 ii.d. 噪声 序列 ，X; ~ U[0,1]，f 的 支撑 集 为 [0,1。 本 文 假 
设 条 件 如 下 : 
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假设 1 随机 变量 序列 {en i = 1,2,… ,n} 具有 一 维 对 称 边 缘分 布 且 si 的 特征 函数 满足 
Eexp{iue;} = exp{—lul|*}, l<« <2. (2) 


假设 2 /在 [0,1| LAK. 

注 1 si 的 特征 函数 为 稳定 分 布 的 特征 函数 ， 即 el 属于 特征 指数 为 «的 稳定 分 布 的 吸收 
域 同 。 当 1 < k < 2 时 ，e1 的 方差 不 存在 ， 为 无 穷 方差 厚 尾随 机 变量 。 

本 文 研究 如 下 假设 检验 问题 : 

Ho: /是 光滑 函数 ， 在 [0,1] 上 至 少 连续 可 微 ; 

Hi(m: f es sink 且 1<g<m( 已 知 )， 除 gq 个 跳跃 点 之 外 了 是 光滑 的 。 

对 样本 {Xi1,… , Xn} 进行 排序 得 到 次 序 统计 量 Xa) < …. < XX(,)， 此 时 模型 (1 ) 变 为 


Yg = f(X0))+es i=1,2, ,nN. (3) 
其 中 Ya M ei DAJE Yi M ei 的 重新 排列 。 模 型 (3) 又 等 价 于 
= f(i/n) + [f(Xw) — FG/n)] +e: = fli/n) + & + ei, (4) 
其 中 总 = f(Xw) ~ fG/n)- 


3 小波 变换 与 变 点 检测 
令 y(u) 是 小 波 母 函数 ， 通 过 伸缩 和 平移 得 到 一 列 小 波 基 函 数 

prlu) 一 27[20(224 k), JEN, kez. 
函数 9 经 过 连续 小 波 变 换 得 到 的 小 波 系数 为 

(wWa,b) = f gwarl) du, aeN beZ. 
实际 中 通常 在 离散 时 间 点 上 观测 函数 ， 因 此 小 波 变换 的 离散 化 是 十 分 必要 的 。 当 给 定 离 散 数 
据 Y = (Yi,… Yn) Ee Malat! 提出 的 塔 型 算法 可 快速 计算 芯 经 过 离散 小 波 变换 得 到 的 经 
验 小 波 系数 (w) = 内 Y， 其 中 三 是 依赖 于 小 波 基 的 一 个 正 交 和 矩阵 ， 指 标 7 为 分 辩 水 平 (对 
应 着 频率 w = 2-7)， 满 足 0 < 7 < J 2 = n, BREAN (空间 ) 参 数 ， 对 应 着 时 间 位 


t= k/2?. 
考虑 到 经 验 小 波 变换 的 也 ?2- 范 数 ，Hirdlefl0l 用 以 下 和 式 来 近似 小 波 变换 的 积分 式 


weg) = z Sala 
i=l 


故 对 任意 的 7, ko BRAY (4) 经 过 小 波 变 换 并 用 上 述 方法 近似 有 
Wyk = Wk(f) + wk(E) + wle), (5) 


其 中 


wk(f) = FE lim (i/n), wik(é) = PE Vot Wi,k(e) = ELY (i/n)ei 
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本 文选 取 Haar “DK, Ww (fF), wiele) wielo 分 别 有 如 下 性 质 : 

引 理 1 加” 当 原 假 设 责成 立时 ，/ 为 连续 可 微 函 数 ， 对 所 有 的 分 辩 水 平 7 > 3， 以 及 任意 
fk. k=0,1,---,27-1, Alwjpe(f)| < avn2-9; SRP A, 成 立时 ，j 中 至 少 存在 一 
个 跳跃 点 ZE [k/2), (hk +1)/27), EE wpe (AI > evn, EPa, co 均 为 只 依赖 于 上 的 常 
数 ， 为 方便 表述 取 ci = co = 1。 

引 理 2 在 任意 水 平 ) 下 ， 对 所 有 的 ke {0,---,27-1}, A 


wj (£) = a > die (i/n) (F(X a) = Fi/n)) = 0, (1). 
i=1 
证 明 因为 X; ~ Uf, 1], MAX: ~ Beta(i,n-—i+1), M\X Gu) ~i/n|=Op(i/n), BAK 
R2, F 
wye(é) = EE Mantis (Xo) ~ fli/n)) = Op(Fz) = 00). 
HF wele) 考虑 到 其 性 质 的 证 明 过 程 令 
we = Parga = wel) + wale) + wale) 


其 中 


wef) Aiwa) wE = Arw, wale) = winle). 
引 理 3 在 任意 分 辩 水 平 了 下， ,27 一 1} 有 





i n+ 00, 
其 中 随机 变量 > 满足 假设 1。 
证 明 利用 Haar 小 波 的 性 质 以 及 假设 1 可 得 
1 m/23 z Ti Lae 
we(e) = <i Du kli/n)ei = 7 2 (+)e; < ee js Pe 


这 里 上 Sn ERMEER E 与 了 9 依 分 布 相等 。 由 广义 中 心 极限 定理 加 知 ， 若 si, ,en 是 ii.d. 随 
机 变量 序列 ，e1 的 特征 函数 为 (2) 式 所 定义 ， 则 有 





rd Brh 


这 里 随机 变量 2 满足 假设 1， 并 且 z 与 si 的 特征 指数 相同 ， 因 此 


wple) Ea 2/21/03 n —+ 00. 


3.1 小波 系数 阅 值 与 检验 临界 值 的 选取 

当 原 假设 Ho 成 立时 ， 小 波 系数 的 大 小 主要 由 wk(e) RE: 而 当 备 择 假设 瑟 成 立时 ， 了 中 
存在 跳跃 点 ， 在 跳跃 点 附近 小 波 系 数 的 绝对 值 很 大 问 。 因 此 ， 本 文 对 分 辨 水 平 了 施加 一 定 的 条 
件 以 保证 至 少 存 在 有 限 个 小 波 系数 大 于 给 定 的 阔 值 ws = (2-37)ira-~<*， 即 有 : 

定理 1 在 水 平 7 下， 对 小 波 系数 jwx| 进行 排序 得 到 jwa)l = lwia | >.> lws 当 原 假 
设 Hy 成 立时 ， 如 果 分 辩 水 平 满足 


— 1 
xn, s> 1<A<2， (6) 
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则 对 任意 的 常数 m > 1， 有 
P{lwon| > Un} — 1, n— oœ. 


这 里 on x bn 指 的 是 存在 常数 cg, cg, TEA BAW n H cabn, < On < cabn。 
证 明 只 考虑 = 1 的 情形 ，m > 1 可 类 似 处 理 。 由 Haar 小 波 的 性 质 可 知 wx,k = 
0,1,- ,27 一 1 是 独立 的 随机 变量 序列 ， 因 此 


27—1 
lws} Som} = TE Pihos < va}. 
k=0 


P{lwayl < en} = P{ m ages 


当 0<z< 1 时 ， 由 不 等 式 1 一 xz < exp(—z) 可 知 
27—1 
P{lwyl < vn} < exp { — $ P(wk| > vn)}. 
k=0 
因此 只 需 证 明 当 n — co 时 
27-1 


An = 5 P(|t%| > vn) — œ 
k=0 


成 立 。 
当 原 假设 五 o 成 立时 ， 有 lwe(f)| < vn» UE jwr] > |we(€) + wele)| 一 vw， 从 而 由 引 理 2 知 


P{lws| > Un} > P{lwe(E) + we(e)| > 20n} = P{|we(e)}] > 2un} 


n/2i 
Pa 2, oj >2- iaio). 


再 由 引 理 3、 假设 1 和 稳定 分 布 的 尾 概率 性 质 可 得 ， 当 ?mm — co 时 


P{jukl > on} = 2P{z > 2.277G Woy) ~ 20, {2-2IHE- Dog po = CBA Dylon, 


EP h(x) ~ g(x) RRK — oo 时 ， „im h(xz)/g(7) = 1， 随 机 变量 z 同 引 理 3 所 指 ， 


Ch = (2 i os sinnde) = Iri) sin (=) 
C 为 常数 ， 下 文 各 式 中 可 能 取 值 不 同 。 故 在 (6) 下 


27 ~—1 
= a P(|wx| > un) > CROs- 一 oo 
k=0 
证 毕 
定理 1 表明 : 噪声 小 波 系数 jwx| BDA mPAF Aa on, Ak, WRT on 设置 的 偏 小 在 
实际 中 不 实用 ， 故 本 文 构造 检验 统计 量 


Ni = Jwa] = |w(m-+1)l> i= 1, 2, ver ym. (7) 
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再 结合 定理 1， 给 出 检验 的 100(1 -- 6)% 置信 和 界 。 
定理 2 令 0< 6< 1 为 任意 常数 





270-“/2)B 一 1/ 
a= larn) e a Uia N >a), (8) 
其 中 
/kK 
Dei iT(%) sin (5), l<K <2, 


则 当 原 假设 责成 立 且 水 平 7 满足 (6) 式 时 ， 有 PIR} < 8B, n 一 oo。 


P(N; > z) Ba) < P(Jwa! — vn > z) Bn), 
w lwa] > lw+s)| [St DS (wom) | 在 排序 之 前 的 小 波 系数 为 lwil, lwiril, ,[Wm]> 由 引 理 1 


P{jwa l 一 2r >2 | Bn} = P{ max lus| ~un >z] Bn} 


1A 


k=i 


do P{lwel -vn > | Bn} < YO P{jwk(€) + we(e)] > z | Br}. 
k=i 
再 由 定理 1、 引 理 2、 引 理 3、 假 设 1 和 稳定 分 布 的 尾 概率 性 质 有 


„im P{N; >| Bn} < ,lim Do P{lwe(€) + wele)] >z | Br} 
k=i 


= lim > P{ wel) > x} ~ 2m —it1)Cy (26-2) y 
k=i 
Hr = Ci» 则 


„im P{Ra(8)} = lim PO P{N > z| Ba} <2) (m -i+ 1)C2 0- Ðe" = p. 
i=l i=l 
证 毕 
注 2 Wangh 对 多 变 点 进行 检验 时 所 用 临界 值 只 有 一 个 ， 而 本 文 的 临界 值 随 变 点 个 数 的 变 
换 而 变化 ， 这 是 因为 噪声 小 波 系 数 的 前 m 个 最 大 值 的 分 布 不 同 。 
£3 ”如果 所 讨论 的 噪声 项 具有 尺度 因子 入 > 0, BY, = (Xi) + Acr i== 1,2,… ,n， 则 临 
界 值 应 为 Aci。 
3.2 ”检验 的 一 致 性 
定理 3 AHER H (m) 成 立时 ， 如 果 水 平 了 满足 (6) 式 ， WA lim P{Rn(8)} = 1。 
证 明 只 对 mm = 1 的 情形 加 以 证 明 ，m > 1 可 类 似 处 理 。 只 需 证 明 





Ni — 00， n— 00. (9) 
令 
0 i ô k-i k—i 
n 一 A os 1 》 < f 
x n 3<%< ae ae ê < a 


Ch = e max |wxr(é€) + we(e)| < ay 


=0,.… ,27—1 
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分 两 步 来 证 明 。 首 先 在 Cn 下 证 明 (9)， 其 次 证 明 
,lim P(Cn) =1. (10) 


存在 kz Aki, (EG Jwa] = lwxsle 利用 (6) 式 有 wv = 0(£n), zn = o(n1-*-8), 故 


lwr, | > (we (fF) ~ En > n? -GTL+oD)， [wka] < lwra(f)| + tn < Un + Ln = O(n), 
因此 
Ni = |way| ~ lwl > ni-n3 (1 + 0(1)) — œ(n — o0). 
(Gi) 证 明 (10) 式 成 立 。 因 为 
25-1 


P(C) = P{ _ max, orl) + wele)| > ea} < D> P{lwelé) + wele)] > en}, 


k=0 
由 引 理 2、 引 理 3、 假 设 1 和 稳定 分 布 的 尾 概率 性 质 可 得 


2-1 
„im P(Ca) < Jim 2 P{|we(e)| > tn} ~ 2 lim {0,2 (| =0. 


证 毕 


4 变 点 估计 


Mi 不仅 可 以 对 变 点 存在 性 进行 检验 ， 还 能 够 在 变 点 存在 时 给 出 变 点 个 数 及 位 置 的 佑 
计 。 设 9 为 函数 的 变 点 个 数 ， 变 点 位 置 依次 为 0<g <- <0 <1,1l<q<m, 
令 4=sup{i:1<i<m, Ni >a}, ki <- < kg PHA wah > ,we)| 在 排序 之 前 所 对 应 的 
Hite, © (61,--- 05) = (ki /2,--- ,kg/27)， 则 有 

推论 1 在 定理 3 的 条 件 下 ， 当 n 一 > co 时 


P(g —9)=1, (11) 

26 — 6;)? = Op (a) (12) 
5 ”数值 模拟 
考虑 如 下 模型 

Y; = f(Xi) + àc, 1=1,2,..,%n, (13) 


其 中 X; ~ U[0, = 0.25, ei 为 特征 指数 < = 1.83 的 稳定 过 程 。 模 拟 分 析 为 

Ho: f(x) = 4sin(4nz); 

Hı: f(x) = 4sin(4rz) ~ sgn(x — 0.3) — sgn(0.58 — x); 
其 中 天 中 的 f(x) 为 WangB] prH Ry heavisine MAX, RA i(a), M 中 的 f(z) 为 含有 两 个 变 点 
的 heavisine 函数 ， 见 图 1(b)。 图 1(c) 和 (da) 分 别 为 Ho 及 Hi 下 数据 3 的 显示 图 。 
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取样 本 容量 n = 21° = 1024， 变 点 个 数 上 界 mm = 3， 检 验 水 平 8 = 0.05。 在 分 辩 水 平 了 = 
5 下 ， 用 Haar 小 波 对 玫 进 行 小 波 分 解 ， 得 到 的 丁 及 囊 下 小 波 分 解 系数 的 绝对 值 luk| 分 别 
见 图 1(e)，(f)， 其 中 水 平 虚线 为 本 文 给 出 的 临界 值 (critical region) 位 置 ， 水 平实 线 是 本 文 立 
值 (threshold) 的 最 大 值 位 置 。 

由 图 1(e) 可 以 看 出 所 有 小 波 系 数 都 小 于 本 文 给 出 的 临界 值 ， 因 此 接受 原 假设 Ho 由 (f) 可 
以 看 出 hwx| 分 别 在 0.3 和 0.58 附 近 超过 临界 值 ， 因 此 接受 有 两 个 变 点 的 备 择 假 设 Hl1， 这 说 明 
本 文 给 出 的 检测 与 估计 方法 是 有 效 的 。 
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图 1: (a) 原 假设 Ho F f(x) = 4sin(4rz); (b) 备 择 假 设 Hi F f(s) = 4sin(4rz) — sgn(x — 0.3) 
一 sgn(0.58 — z); (c) Ho 下 模拟 数据 图 ; (d) Hi 下 模拟 数据 图 ; (ce) 7 =5, Ho 下 小 波 分 
解 系数 的 绝对 值 ; (f) 7 二 5, Hi 下 小 波 分 解 系数 的 绝对 值 
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本 小 节 用 美国 IBM 股票 数据 做 实例 分 析 ， 该 数据 为 1997 年 12 月 19 日 至 1999 年 12 月 31 日 
512 个 IBM 股票 日 收盘 价 ， 数 据 原始 序列 已 见 图 2(a)。 由 图 可 知 序列 中 存在 跳跃 点 。 因 为 股 
票数 据 常 是 厚 尾 序列 ， 为 此 引入 Mondebrotl"] 中 的 方法 估计 特征 指数 kx。 首先 对 原始 数据 进行 
对 数 差分 见 图 2(b)， 然 后 将 yt = nP -也 已 :从 大 到 小 排列 ， 最 后 用 点 (nyo ln(i/n)) 拟 
合 一 条 直线 ， 直 线 的 斜率 便 是 & 的 估计 值 ， 见 图 2(c)， 估 计 得 出 rk = 1.6235， 其 中 i = 
11,… ,160。 利 用 本 文 的 方法 对 该 数据 可 能 存在 的 变 点 进行 检测 与 估计 。 

取 变 点 个 数 上 界 m = 6， 检 验 水 平 B = 0.05, HERI = 4 下 ， 用 Haar 小 波 对 数据 进行 小 
波 分 解 得 到 的 小 波 系 数 绝对 值 见 图 2(d)， 其 中 的 水 平 虚线 是 临界 值 位 置 。 从 图 2(d) 可 以 看 出 ， 
小 波 系数 在 四 处 超过 临界 值 ， 分 别 对 应 第 274(1999 年 1 月 22 日 )，336 (1999 年 4 月 22 H), 361 
(1999 年 5 月 27 日 )， 和 463(1999 年 10 月 21 日 )， 这 说 明 在 相应 的 时 间 附 近 有 变 点 出 现 。 图 2(a) 
中 的 虚线 给 出 的 是 变 点 实际 发 生 的 时 刻 。 变 点 发 生 的 部 分 原因 可 能 是 受到 亚洲 金融 和 危机 和 俄 罗 
斯 金融 危机 及 后 续 的 影响 。 



































critical region 




















A -46 -42 -38 -34 -3 % 300 200 300 400 500 
nYa) t 
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图 2: (a) 512A IBM 日 收盘 价 原始 数据 图 ; (b) 原始 数据 对 数 差分 图 ; (c) 特征 指数 估计 图 ; 
(d) j= 4 下 小 波 分 解 系数 的 绝对 值 
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Wavelet Estimation of Change-points in a Nonparametric Regression 
Function with Heavy-tailed Noise 
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Abstract: A wavelet method is proposed to detect and estimate change points in nonparametric 
regression models under random design, whose noise is a heavy tailed infinite-varianced process. If 
the null hypothesis holds, we obtain critical values at any scale and prove the consistency of the test 
by using the test statistics based on empirical wavelet coefficients. If the alternative hypothesis holds, 
we show that the estimation of the numbers and location of change points are consistent. Numerical 
simulation results as well as the IBM stock data analysis indicate that the proposed method is effective. 
Keywords: random design; nonparametric regression model; infinite-varianced process; change points; 


wavelet estimation 
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